데이터 발굴 - 훌륭한 개발자 블로그

Hadoop의 HDFS 학습

세 서버 모두 CentOS 6.6 설치를 최소화하고 호스트 이름, 정적 IP 주소를 설정합니다. 세 서버 간 SSH 암호 없는 로그인 설정 CentOS 최소화 설치는 scp와 ssh 클라이언트 프로그램을 설치하지 않았습니다.rpm 패키지를 통해 다음과 같이 설치합니다. 참고: SSH 서비스를 통해 리눅스 서버에 원격으로 액세스할 때 연결이 매우 느리므로 SSH의 DNS 반해상도를 해제하고 다...

데이터 발굴

MySQL에서 머신러닝용 경마 데이터 준비

하지만 자유형 구축의 논리에도 시간이 걸리고 자유형 자체에도 시간이 걸리는 점 등을 고려해 이번에는 중앙경마를 주최하는 JRA가 제공하는 JRA-VAN 데이터 실험실의 무료 체험판에 첨부된 DVD 데이터로 MySQL을 구축했다. JRA는 JRA-VAN이라는 서비스를 통해 각종 경마 예측 데이터와 예측 도구를 제공한다.이번에 사용한 무료 체험판 DVD는 아래 URL에서 신청할 수 있습니다.한편...

MySQL경마기계 학습데이터 발굴

간단한 특징 공정: 특징 선택

피쳐를 선택하는 세 가지 방법: ① 방차선택법 ② 상관계수법 ③귀속특징해소법 핵심 모듈 함수:sklearn.feature_selection 정의: 각 특징의 방차를 계산하고 한도값을 이용하여 방차가 한도값보다 큰 특징을 선택한다. 정의: 각 피쳐가 대상 값에 대한 상관 계수를 계산하고 연관된 피쳐 선택 정의: 하나의 기본 모델로 다륜 훈련을 하고 훈련 후 지정된 특징 수를 보존한다. 정의: ...

데이터 발굴

DDD 영역 모델 개발

집계(Aggregation): 이것은 느슨한 대상 간의 관계다.예를 들어 컴퓨터와 그의 외곽 설비가 바로 예이다. 이것은 매우 강한 대상 간의 관계이다. 예를 들어 나무와 나뭇잎 사이의 관계다. 하나의 합성에서 부분과 전체의 생명 주기는 모두 같다.합성된 새로운 대상은 그 구성 부분에 대한 지배권을 완전히 가지고 있다.그들의 창립과 파멸을 포함한다. 집계: • 부분 집합에 독립적으로 존재 [...

데이터 발굴영역 모델

spark를 이용하여 텍스트 분류 분석을 하다

분류 분석은 데이터에서 발견된 묘사 대상과 그 관계에 대한 정보에 근거하여 데이터 대상을 그룹으로 나누는 것이다.그룹 내의 객체는 서로 비슷한(연관된) 반면 서로 다른 그룹의 객체는 다름(연관되지 않음)이라는 것이 목표다.그룹 내의 유사성(동질성)이 클수록 그룹 간의 차이가 클수록 분류가 좋다. 우리는 사용자의 검색어에 따라 목표 사용자 그룹을 세분화하고 서로 다른 사용자 그룹이 어떤 정보에...

spark텍스트 컬렉션데이터 발굴

Pandas 자세히 보기 11 Fillna 부족 데이터 채우기

약속: fillna ()가 가장 중요한 처리 방식입니다. 코드 결과: NaN NaN NaN NaN NaN NaN 상수로 채우기: 코드 결과: 사전을 통해 다른 상수를 채우기: 코드 결과: inplace=True로 전송하여 원 대상을 직접 수정: 코드 결과: method="삽입 값 바꾸기: 코드 결과: NaN NaN NaN NaN NaN 9.0 코드 결과: 전송 limit="충전 개수 제한: ...

기계 학습데이터 발굴Python데이터 분석의 이점 - Pandas

기계 학습 - 증 량 훈련 방법

우리 가 말 하고 자 하 는 것 은 유한 한 메모리 에서 증 량 훈련 방법 을 통 해 특징의 증 량 훈련 을 실현 하 는 것 이다.핵심 적 인 방법 은 데 이 터 를 한 번 만 옮 겨 다 니 면 이런 통 계량 을 계산 할 수 있 는 방법 이다. 이상 하 게 빠 지면 다시 훈련 하 는 것 이 무섭다.이에 따라 텐 서 플 로 우 등의 틀 에 서 는 지난번 이상 하 게 빠 진 곳 에서 훈련 을 이...

데이터 분석데이터 발굴

웹 정보 캡 처

- 커 뮤 니 티 에서 많은 사람들 이 홈 페이지 정 보 를 캡 처 할 필요 가 있 는 것 을 보고 제 가 만 든 DEMO 를 올 려 서 참고 하 시기 바 랍 니 다. 여러분 들 도 의견 을 많이 제시 하고 이 작은 절 차 를 보완 하 는 것 을 함께 공부 하 시기 바 랍 니 다. 1) 웹 페이지 데 이 터 를 다운로드 합 니 다. 웹 페이지 Url 을 지정 하여 웹 페이지 소스 코드 를 얻...

데이터 발굴정규 표현 식. Net 지식수필